Световни новини без цензура!
Решението на AI за „проблема с коктейлното парти“, използвано в съда
Снимка: bbc.com
BBC News | 2025-01-12 | 23:47:52

Решението на AI за „проблема с коктейлното парти“, използвано в съда

Това е безконечният „ проблем с коктейлното празненство “ – стоиш в стая, цялостна с хора, с пиво в ръка, пробвайки се да чуеш какъв е твоят сътрудник казвайки.

Всъщност човешките същества са удивително умели да водят диалог с един човек, като в същото време филтрират конкуриращи се гласове.

Въпреки това, може би изненадващо, това е умеене, което технологията до неотдавна не можеше имитация.

И това има значение, когато става дума за потребление на аудиодоказателство в правосъдни каузи. Гласовете във фонов режим могат да затруднят да бъдете сигурни кой приказва и какво се споделя, като евентуално вършат записите безполезни.

Електроинженер Кийт МакЕлвийн, създател и основен софтуерен шеф от Wave Sciences, се заинтересува от казуса, когато работеше за държавното управление на Съединени американски щати по дело за военни закононарушения.

" Това, което се опитвахме да разберем, беше кой е поръчал избиването на цивилни. Някои от доказателствата включват записи с куп гласове, които приказват едновременно - и тогава научих какво „ казусът с коктейлното празненство “ беше “, споделя той.

„ Имах триумф в премахването на звук като автомобилни звуци или климатици или вентилатори от речта, само че когато започнах да се пробвам да отстрани речта от речта, това се оказа освен доста сложен проблем, само че и един от класическите сложни проблеми в акустиката. p>

" Звуците подскачат из стая и е математически извънредно за решение. "

Отговорът, споделя той, беше да се употребява AI, с цел да се опита да дефинира и отсее всички конкуриращи се звуци въз основа на това от кое място са пристигнали в началото в стаята.

Това не значи единствено други хора, които може да приказват - има и доста количество разстройства от метода, по който се отразяват звуците към стая, като гласът на целевия говорещ се чува както директно, по този начин и непряко.

В съвършена безехова камера - такава, която е изцяло свободна от ехтене - един микрофон на представител би бъдете задоволителни, с цел да разберете какво споделят всички; само че в същинска стая казусът също изисква микрофон за всеки отразен тон.

Г-н МакЕлвийн основава Wave Sciences през 2009 година, надявайки се да създаде технология, която може да отдели припокриващи се гласове. Първоначално компанията употребява огромен брой микрофони в това, което е известно като солидно образуване на лъч.

Въпреки това, противоположната връзка от евентуални търговски сътрудници беше, че системата изисква прекалено много микрофони за обвързваните разноски, с цел да даде положителни резултати в доста обстановки - и няма да работи при всички в доста други.

" Общият рефрен беше, че в случай че можехме да излезем с решение, което да адресира тези терзания, те биха били доста заинтригувани “, споделя господин МакЕлвийн.

И той прибавя: „ Знаехме, че би трябвало да има решение, тъй като можете направете го единствено с две уши. "

Компанията най-сетне реши казуса след 10 години вътрешно финансираха проучвания и подадоха поръчка за патент през септември 2019 година

Това, което бяха измислили, беше AI, който може да проучва по какъв начин звукът отскача в стаята, преди да доближи до микрофона или ухо.

" Ние улавяме звука, до момента в който идва до всеки микрофон, връщаме обратно, с цел да разберем от кое място идва, и по-късно всъщност потискаме всеки тон, който не би могъл да пристигна от мястото, където седи индивидът “, споделя господин МакЕлвийн.

Ефектът е съпоставим в някои връзки с това, когато камерата концентрира върху един обект и замъглява предния и задния проект.

“Резултатите не звучат кристално ясно, когато можете да употребявате единствено доста гръмък запис, с цел да се учите, само че те към момента са зашеметяващо. "

Технологията беше употребена за първи път в правосъдна медицина в действителен свят при положение на ликвидиране в Съединени американски щати, където доказателствата, които съумя да даде, се оказаха централни за присъдите.

След като двама наемни убийци бяха задържани за убийството на мъж, ФБР искаше да потвърди, че те са били наети от семейство, преминаващо през спор за настойничество над деца, ФБР е уредило фамилията да повярва, че са били изнудвани за присъединяване им - и по-късно се е отпуснало, с цел да види реакцията.

Докато известията и телефонните позвънявания бяха относително лесни за достъп от ФБР, персоналните срещи в два ресторанта бяха друг въпрос. Но съдът позволи потреблението на логаритъма на Wave Sciences, което значи, че аудиото се трансформира от неприемливо в главно доказателство.

Оттогава други държавни лаборатории, в това число в Обединеното кралство, са го подложили на набор от проби. Сега компанията предлага технологията на американската войска, която я е употребила за анализиране на сонарни сигнали.

Тя също може да има приложения при договаряния за заложници и сюжети за самоубийство, споделя господин МакЕлвийн, с цел да е несъмнено, че и двете страни на диалога могат да бъдат чути – освен договарящият с мегафон.

В края на предходната година компанията пусна софтуерно приложение, употребяващо своя логаритъм за образование за потребление от държавни лаборатории, извършващи аудио криминалистика и акустичен разбор.

В последна сметка се стреми да показа персонализирани версии на своя артикул за потребление в комплект за аудио запис, гласови интерфейси за коли, интелигентни високоговорители, разширена и виртуална действителност, сонар и слух помощни средства.

Така че, да вземем за пример, в случай че говорите с колата или интелигентния си високоговорител, няма да има значение дали към вас има доста звук, устройството към момента ще може да разбере какво казвате.

ИИ към този момент се употребява и в други области на правосъдната медицина, съгласно правосъдния възпитател Тери Армента от Академията за криминалистика.

" ML [машинно обучение] модели проучват гласови модели, с цел да дефинират самоличността на говорещите, изключително потребен развой в престъпни следствия, където гласовите доказателства би трябвало да бъдат удостоверени “, споделя тя.

" Освен това AI инструментите могат да откриват операции или промени в аудиозаписи, като подсигуряват целостта на доказателствата, показани в съда. "

И AI си проправя път и в други аспекти на аудио разбора.

Bosch има технология, наречена SoundSee, която употребява логаритми за обработка на аудиосигнали, с цел да проучва, да вземем за пример, звука на мотора, с цел да планува нередовност, преди да се случи. >

" Традиционните благоприятни условия за обработка на аудиосигнали нямат способността да схващат звука по метода, по който ние, хората, го вършим “, споделя доктор Самарджит Дас, шеф по проучвания и технологии в Bosch USA.

„ Аудио AI разрешава по-задълбочено схващане и семантична интерпретация на звука на нещата към нас по-добре от всеки път - да вземем за пример звуци от околната среда или звукови сигнали, предавани от машини. "

По-скорошни проби на логаритъма на Wave Sciences демонстрираха, че даже единствено с два микрофона технологията може да работи толкоз добре, колкото човешкото ухо - по-добре, когато повече добавени са микрофони.

И те разкриха още нещо.

" Математиката във всички наши проби демонстрира забележителни прилики с човешкия слух. Има дребни странности по отношение на това какво може да направи нашият логаритъм и какъв брой тъкмо може да го направи, които са изумително сходни на някои от странностите, които съществуват в човешкия слух ", споделя МакЕлвийн.

" Подозираме, че човешкият мозък може да употребява същата математика - че при решаването на казуса с коктейла може да сме се натъкнали на това, което в действителност се случва в мозъка. "

Прочетете повече за AI

Източник: bbc.com


Свързани новини

Коментари

Топ новини

WorldNews

© Всички права запазени!